人工智慧專家 維圖歐索

都問AI吧!ChatGPT上手的第一本書

GPT-4 登場!跟 ChatGPT 差在哪?歷代 GPT 一次比較


人工智慧(AI)的世界在不斷發展,一直有新的突破和進步。但有一項發展特別引起了人工智慧界的注意,那就是 ChatGPT 的出現。GPT 是 Generative Pre-trained Transformer 的簡稱,中文全名為生成型預訓練變換模型。ChatGPT 是指能夠對話的 GPT 版本。ChatGPT於 2022 年 12 月首次公布,由於能力和潛在的應用令人印象深刻,讓人工智慧社群興奮不已,並引發了熱烈的討論。
ChatGPT 與過往其他版本不同,它的亮相之所以吸睛,是因為眾人在與它接觸後,發現向 ChatGPT 提問不僅能夠得出有意義的答案,更能夠得出超過自身能力的答案,這讓大家意識到,若能善用 ChatGPT,等同於擁有一位隱形的超級智能夥伴。
OpanAI 的註冊會員在短時間內就站上了一億人數大關。但由於大量的會員使用,使得系統負荷過重,因此 OpenAI 提議開設收費 20 美元的版本。儘管如此,市場依然趨之若鶩。這也是生平第一次,大家晚上聊天的對象從社群網路上的網友變成了需收費的生成式機器人。
到底 GPT 是什麼?為什麼具有如此強大的能力?
GPT 的版本和進化:GPT-2、GPT-3、ChatGPT,到底差在哪?
要深入下去前,首先需要瞭解 GPT 家族的沿革。GPT 受到技術領域注目是 2019 年的 GPT-2。當時這一個版本已有辦法接續舊文章,生成新的有意義的內容。2020 年,OpenAI 又發表了 GPT-3。這個版本,遠較 GPT-2 先進許多。
GPT-2 與 GPT-3 的比較
GPT-2
發表年:2019
參數:15 億
資料來源:網路文本。40 GB 的文本,800 萬份文件,来自 Reddit 上 4500 萬則貼文。
用途:生成文本,執行語言任務,如翻譯、總結等。
GPT-3
發表年:2020
參數:1750 億
資料來源:570 GB 的文本。主要是網路上抓來的文字、英語維基百科。
用途:生成文本,執行語言任務,如翻譯、總結等,以及完成編碼任務、玩遊戲和回答問題。
值得一提的是,GPT-3 在自然語言處理(NLP)領域中取得了重大的突破,成為了當時最大、最強大的自然語言生成模型,同時它的應用領域也非常廣泛,從機器翻譯到文章總結輸出,都有著非常出色的表現。
儘管 GPT 家族在技術上取得了重大突破,但卻始終未能引起大眾的關注。這主要是由於兩個因素所致:
首先,當時正值全球疫情嚴峻的時期,人們被迫將注意力集中在應對疫情方面,對於人工智慧領域的發展缺乏足夠的關注和時間。
其次,儘管 GPT-3 在當時被認為是目前最先進的自然語言處理模型,但是還存在一個致命的缺陷,那就是它無法進行智能對話。這意味著 GPT-3 只能執行單向任務,需要人工執行指令操作,這限制了其實際應用的範圍。這也是為什麼只有少數開發者才有能力和興趣去應用 GPT-3。
相比之下,ChatGPT 在推出後很快獲得了廣泛的關注和認可,主要是因為 ChatGPT 具備智能對話的能力,使用者可以與 ChatGPT 自然地對話,產生有意義的對話內容。這使得 ChatGPT 在應用領域上擁有了更廣泛的可能性,因此受到許多開發者和使用者的追捧和喜愛。
ChatGPT 的背景資料
發表年:2022
參數:3.45 億
資料來源:網路文字
用途:為聊天功能生成文本,回答問題,提供建議等等。
ChatGPT 之所以受到如此廣泛的關注和喜愛,是因為它具備了 GPT-3 所缺乏的關鍵功能: 對話設計。 對於許多人來說,評估一個人工智慧模型的好壞,往往是看它是否能夠在一次來回的對話中聽懂使用者的問題,並給出令人滿意的答案。 相比於背後的知識量,人們更關注 AI 模型的「溝通能力」。
ChatGPT 的出現大大提升了人工智慧模型的溝通能力,因此讓世人驚覺人工智慧的先進程度。這就是 ChatGPT 受到廣泛關注的原因。同時,ChatGPT 的成功也讓人們重新關注 GPT 家族的潛力和威力,進一步推動了自然語言處理技術的發展。
嗑了仙丹的 AI —— ChatGPT!能處理廣泛的自然語言任務
ChatGPT 或 GPT-3 的使用者常常對這些模型能夠生成的結果讚不絕口。這些模型能夠以比人類快上 10 倍甚至 20 倍以上的速度生成文本,並且生成的文本質量高,令人印象深刻。這是因為 GPT-3 採用了 Transformer 架構,並在大量文本資料上預先進行了訓練,因此能夠處理廣泛的自然語言任務,如語言翻譯、總結、文本分類和問題回答等。
相比於其他語言模型,GPT-3 具有更高的準確性和流暢性,這是由於它採用了一種全新的神經網絡結構和更先進的學習算法。在 GPT-3 預訓練的過程中,模型透過閱讀大量的文本資料,從而學習了豐富的知識和文本生成技巧。
簡單來說, GPT-3 的架構就是透過餵入大量的範本,學習拆解這些範本並重新組合出新的結果。 引擎設計者所餵入的資料越多,GPT-3 獲得的知識就越豐富。例如,OpenAI 在 GPT-3 的預訓練過程中餵入了超過 570GB 的文本資料。 當 GPT-3 獲得足夠豐富的知識庫時,其生成的結果也變得越來越精確。
使用者只需要將自己的工作透過語意拆分成多個小任務,讓 GPT-3 分別完成,再將結果組裝起來,就能像有了 10 倍超能力的工作者一樣高效地完成工作。
GPT 的影響:許多我們認為不可能被顛覆的領域,都可能受到影響
一個人擁有 10 倍超能力是一件好事。但是當幾百萬人有了 10 倍超能力,那會發生什麼事情就難以想像。因此,ChatGPT 的推出可能成為當前科技史上影響最大的事件之一。當每個人都擁有超能力時,各行各業將會發生怎樣的變化呢?
GPT 的自然語言生成能力可用於重複性任務的自動化,如寫作、內容創建和客戶服務。乍看之下 GPT 的誕生似乎只影響文學界,實則不然,而是影響多個行業。因為各行各業的書面表達、交流、知識保存、創造都是以文本為基底,所以受影響可能是全方面的。
當然,有些人可能會認為 GPT 目前只具備通用知識,尚未入侵專業領域。然而,我認為這只是一時的錯覺。隨著 GPT 不斷地學習和進化,它的應用範圍可能會不斷擴大,並且將對各種領域產生深遠的影響。
目前開放的 GPT 是一個通用引擎,不代表這個引擎未來不可能進化。 事實上,它有可能加入專業知識庫,進行資料訓練和結果微調。許多我們認為不可能被顛覆的領域,如專業技術教育、醫療保健和金融等領域的工作崗位可能會受到影響。
然而,隨著工作者擁有 10 倍能力變成超人,我們也需要關注一些可能引發的道德和社會問題。例如,如果工作者變成了超人,那麼壞人的能力是否也同樣提升了呢?再來是,人們一旦過於相信 AI 所提供的資訊,生成的結果萬一有嚴重的錯誤資訊,或管理 AI 的公司植入煽動性的看法,例如劍橋公司對脫歐事件的影響,可能會帶來什麼樣的嚴重後果?
我們需要關注眾人使用這一強大技術所帶來的潛在後果以及相關責任。
(本文出自《都問 AI 吧!ChatGPT 上手的第一本書》,商周出版;外電資料來源 / Heise Medien)
